2025-01-15 11:43:52.AIbase.
OpenBMB publie le modèle multi-modal MiniCPM-o2.6 : traitement visuel et vocal possible même sur téléphone portable
2024-11-19 13:51:41.AIbase.
L'équipe de l'Université de Pékin publie LLaVA-o1, un modèle multi-modal avec des capacités de raisonnement comparables à GPT-o1 !
2024-10-25 11:16:59.AIbase.
Salesforce AI Research présente le nouveau modèle multi-modal BLIP-3-Video : une solution économique pour la compréhension vidéo
2024-09-26 14:34:11.AIbase.
Le modèle multi-modal open source Molmo identifie les objets sur les images et génère des descriptions précises
2024-06-19 09:20:50.AIbase.
Meta publie plusieurs modèles : le modèle multi-modal Chameleon, le modèle de génération de musique à partir de texte JASCO, la technique de filigrane audio AudioSeal, etc.
2024-01-31 10:12:49.AIbase.
Le modèle multi-modal open source LLaVA-1.5 de Microsoft rivalise avec GPT-4V
2023-11-08 10:51:15.AIbase.
Smoore Technology lance IndustryGPT V1.0, le premier grand modèle multi-modal industriel au monde
2023-11-06 09:28:37.AIbase.